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Huvudfaxen Kassan 

Foreliggande uppfinning h&nfor sig till ett f&r- 
farande och en anordning for registrering av text genom 
avbildning av texten pa en ljuskanslig sensor med en 
5 tvadimensionell sensoryta, vilken sensor ar avsedd for 
digital registrering av bilder. 

Det firms manga situationer i vilka personer Gnskar 
sammanstalla valda delar av text- eller bildinf ormation 

10 till ett dokument som kan redigeras med lamplig mjukvara 
i en dator. Ett kant satt att mata in text- och bild- 
inf ormation i en dator ar att anvanda en scanner. Scann- 
rar firms av bade fast och portabel typ. En fast scanner 
anvands for att laaa in hela sidor med text- och bild- 

15 information, varvid scannern automatiekt fors over sidan 
med konstant hastighet. Denna typ av scanner ar inte 
lampad for inlasning av valda delar av information pa en 
sida . Daremot kan en portabel scanner vara lamplig f6r 
detta andamal. 

20 I US 5 301 243 beskrivs en handhallen scanner for 

lasning av tecken frSn en Strang av tecken pa ett sub- 
strat . Scannern, som f6rs i kontakt med substratet 6ver 
tecknen som skall lasas, har ett optiskt system som "ser" 
en liten del av substratet. Det optiska systemet inne- 

25 f attar en linjesensor av CCD- typ, vilken har ett flertal, 
p& linje anordnade, ljuskansliga element. Nar scannern 
fors over tecknen pa substratet registreras en f6ljd av 
vertikala "skiver" av tecknen och av mellanrummen mellan 
dessa. "Skivorna" lagras i scannern som en digital bit- 

30 mapp. En OCR-programvara (OCR » Optical Character Recog- 
nition, optisk teckenigenkanning) anvands darefter for 
att identifiers de inlasta tecknen och lagra dem i 
teckenkodad form, t ex med hjalp av ASCII-kod, i ett 
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minne. Teckenigenk&nningen kan antingen goras i scannem 
eller i en extern dator till vilken de bitmappade tecknen 
har lasts 6ver. 

En annan typ av handh&llen scanner for textinmatning 
5 beskrivs i US 4 949 391. Denna scanner har till skillnad 
fr&n den ovan beskrivna en tvidimensionell sensor, som 
registrerar bilder av den underliggande ytan d& scannem 
forflyttas 6ver den. Scarmern kan bara forflyttas i en 
riktning som bes tarns av ett hjul som anligger mot ytan. 
10 Innan de registrerade bilderna satts samrnan till en 

storre bild tas redundant information bort ur bilderna. 
Den storre bilden kan analyseras i en dator fdr att iden- 
tifiera tecken. 

En nackdel med de ovan beskrivna och 1 iknande hand- 
15 hillna ecannrar &r att deras "synfait" ar fdrhillandevis 
litet. For att registrera en stdrre inf ormationsmangd, 
sifiom ett textavsnitt best&ende av flera rader, m&ste en 
anvandare darfor f6ra scannern fram och tillbaka dver 
ytan upprepade ginger, vilket ofta upplevs som tids5dande 
20 och enformigt. 

I sokandens PCT-ansokan SE99/00716 beskrivs en 
anordning f6r registrering av information fr&n ett under- 
lag. Anordningen kan arbeta i tvi moder. I den ena moden 
registreras ett flertal bilder p& avst&nd fr&n underlaget 
25 b£l att mer an en textrad registreras i varje bild. Ett 
problem med en sadan har anordning ar att det kravs 
; tidskravande berSkningar f6r att pussla ihop bilderna d& 

\ * de ar stora, om tillrScklig noggrannhet skall erhailas 

for att man akall kunna utfora optisk teckenigenkanning 
— ; 3 0 p& den fardiga bilden om den fardiga bilden bestir av ett 

flertal pusslade bilder- Pussling ar mojlig att genomfora 
: i en dimension, dvg att sensorn fora frSn vanster till 

hoger. Om sensorn fors fram och tillbaka behovs 
etnellertid pussling i tv& dimensioner, vilket stailer 
"* : 3 5 oerhdrt stora krav p& pusslingsberakningarna. 
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Det finns saledes ett behov av en anordning och ett 
forfarande som tillater snabbare pussling av skriven 
text . 

gamma,nfftt;tyiinq av uppf inninqen 
5 Ett andamal med fdreliggande uppf inning ar att 

Astadkomnia ett forfarande, en anordning och ett da tor- 
program som m6jligg6r snabb registrering av text i 
realtid. 

Detta andamal uppfylles med en anordning, ett for- 
10 farande och ett datorprogram enligt de vidhangande 
pa t ent kraven . 

En grundtanke med f&religgande uppfinning ar att man 
registrerar ett flertal bilder av en text, vilka bilder 
overlappar varandra. Darefter utfor man OCR (Optical 
15 Character Recognition, optisk teckenigenkanning) pa de 
registrerade bilderna och erhaller teckenuppsattningar 
vilka innehaller ett flertal tecken. Teckenuppsatt- 
ningarna innehaller eventuellt ett antal tecken som 
markerar radslut om texten innehaller flera rader, 
20 Darefter pusslar man ihop teckenuppsattningarna med 

anvandning av tecknen i teckenuppsattningarna. En stor 
fdrdel med det har angreppssattet ar att man kan 
registrera relativt 3tora bilder at gangen utan att 
pusslingen av bilderna blir epeciellt tidskravande 
25 eftersom man forst omrvandlar bilderna till tecken och 
sedan pusslar ihop teckenuppsattningarna. Darmed ar 
. : pusslingen inte alls lika tidskravande eftersom den 

" ef fektiva upplosningen ar betydligt lagre i en 

* : teckenuppsattning in vad den ar i en bitmappbild. Den 

30 ef fektiva upplosningen i teckenuppsattningen ar ett 
- : tecken* Aven pussling i tva dimensioner blir praktiskt 

mojligt med uppf inning en. 
T Radema i tva registrerade bilder sammanf aller inte 

n6dvandigtvis. Forsta raden i en f6rsta registrerad bild 
"": 35 motsvarar exempelvis tredje raden i en andra registrerad 

:: . bild. 
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Med teckenuppsattning avses i det har sammanhanget 
ett flertal tecken, fran vilken teckenuppsattning 
tecknene inbordes lagen kan bestammas* Teckenupp- 
sattningen kan exempelvis vara en teckenstr&ng som 
5 innehaller tecken f6r mellanslag och radslut. 

En anordning f6r registrering av en text enligt upp- 
finningen g&r det genom avbildning av texten pa en ljus- 
k&nslig sensor med en tvadimensionell sensoryta, vilken 
sensor ar avsedd for digital registrering av bilder av 
10 texten, vilka bilder har delvis dverlappande innehall . 

Anordningen utm^rkes av att den ar anordnad att omvandla 
itminetone tva av de med sensora registrerade bildema 
till vars en teckenuppsattning, innefattande ett flertal 
tecken, medelst teckenigenkanning. Anordningen 4r 
15 anordnad att darefter pussla ihop teckenuppsattningarna 
med ledning av tecknen i teckenuppsattningarna, 

Sasom n&mnts ovan finns det stora f6rdelar med en 
sadan har anordning, Genom att man genomfor tecken- 
igenkanning innan man pusslar ihop bilderna undviker man 
20 den berakningskr&vande operationen att pussla ihop stora 
bilder pa bildpunktsniva. Det finns heller ingen risk f6r 
att man inte skulle kinna igen nagot tecken pga dalig 
pussling vilket ar fallet nar man fdrst pusslar ihop 
stora digital a bilder och darefter utf6r teckenigen- 
25 kanning p& tecken som mojligen ligger i ett omrade som 
6verlappas av bada de bilder som skall pusslas ihop. I 
det senare fallet finns risken f6r att tecknet blir 
forvrangt om pussl ingen inte gors med tillrackligt stor 
noggrannhet vilket i sin tur leder till att tecknet inte 
3 0 kanns igen vid teckenigenkanningen. Med en anordning 

enligt uppfinningen i.r risken mindre f6r att ett tecken 
inte skall kannas igen eftersom man har den ursprungliga 
kvaliteten pa bilden nar man utfor teckenigenkanningen. 
Genom att man forst omvandlar bilderna till 
35 teckenuppsattningar si gar sjalva pussl ingen av 

teckenuppsattningarna relativt snabbt att genomfdra 
eftersom antalet tecken ar betydligt mindre &n antalet 
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bildpunkcer i de registrerade bilderna. Genom att man 
OCR-tolkar varje bild innan pusslingen fir man flera OCR- 
tolkningar av samma tecken, en fdr varje bild dar tecknet 
ingar, och kan valja den tolkning som givit sakrast 
resultat . 

Aven om det ar meet fordelaktigt att pussla ihop 
teckenupps&ttningarna genom att j&mf6ra de enskilda 
tecknen i teckenuppsattningarna &r det mojligt att anord- 
ningen ar anordnad att pussla ihop teckenuppsattningarna 
med hjalp av ord i teckenuppsattningen. S&ledes jamffirs 
hela ord i den ena av de teckenuppsattningar som skall 
puss las ihop med ord i den andra av de teckenupp- 
sattningar som skall pusslas ihop. N&r man pusslar ihop 
ord miste man i praktiken and& jimfSra varje enskilt 
tecken „ 

Med ord menas i det hikr sammanhanget ett f lertal 
tecken som &r avgr&nsade med speciella f Srutbestamda 
tecken. De speciella tecknen Sr exempelvis mellanslag, 
punkt, komma eller radslut. 

Med f6rdel ar anordningen anordnad att hitta text- 
raderna i de registrerade bilderna, att hitta start och 
slut for ord lings textraderna, och att vSlja vilka av de 
registrerade bilderna som skall omvandlas till tecken- 
uppsattningar med ledning av ordens i dent if ierade start 
och slut i de registrerade bilderna, s& att endast bilder 
med n6dv&ndig information omvandlas till teckenuppsatt- 
ningar. Genom att identifiera start och slut f&r orden 
ISngs textraderna blir det mojligt att gdra en grov puss- 
ling av bilderna utan att genomfSra optisk teckenigenkan- 
ning. N&r man har identifierat ordens start och slut 
korrigerar man de registrerade bilderna for rotation och 
perspektiv. Genom att g6ra en grov puseling av bilderna 
blir det mdjligt att ta reda pa hur bilderna fiverlappar 
varandra. De bilder som endast inneh&ller information som 
firms fullstandigt i andra bilder behdver d& inte om- 
vandlas till teckenuppsattningar och darigenom minimerar 
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man berakningsarbetet for att omvandla bilderna till 
teckenuppsattningar . 

Med fordel identifieras start och slut for ord langs 
textraderna genom att man pi varje punkt l^ngs en linje 
5 genom textraderna soker efter antalet morka punkter ett 
forutbest&mt antal bildpunkter upp och ner firan 
textlinjen, varvid ett ordslut definieras som att man 
inte har n4gra morka bildpunkter p& ett f6rutbest&mt 
antal bildpunkter ovanfor och nedanf6r textlinjen, dvs 

10 man har mellanslag. F6r att hantera kursiv stil kan man 
alternative leta utmed en sned linje. Givetvis &r det 
m&jligt att man istallet for mfirka bildpunkter letar 
efter ljusa bildpunkter i fallet att texten skulle vara 
1 jus are an bakgrunden. 

15 Med f6rdel omvandlas bilderna till bin&ra bilder, 

dvs bilder som endast inneh&ller svart och vitt, eftersom 
detta underl&ttar den fortsatta bildbehandlingen. 

Med fordel ar anordningen anordnad att hitta 
textraderna i de registrerade bilderna med hjalp av 

2 0 Hough— transformering av de registrerade bilderna. 

Givetvis kan man hitta textraderna pa nSgot annat satt 
ockaa men Hough- transformering ar ett effektivt satt att 
gora det p&. Hough- transformering kan i korthet beskrivas 
p& ffiljande satt. Det finns ett o&ndligt antal rata 
25 linjer som gar igenom en punkt i ett XY-plan. Den rata 
linjena ekvation f6r var och en av de har linjema kan 
uttryckas med tv& parametrar. Om man plot tar de olika 
linjernas parametrar i ett diagram erhAlls en kurva som 
mot s var ar Hough- transformen f6r punkten. Maui kan p& det 

3 0 har sattet plotta kurvor for vilken som heist av 

punkt e ma i XY-planet, vilka kurvor Sr punkternas Hough- 
transform. Tva olika punkters Hough- trans form kommer att 
sk&ra varandra i en punkt vilken punkt motsvarar den rata 
linjens ekvation for den linje som g&r igenom de bada 
35 punkterna. Om man p& motsvarande satt plottar Hough- 
trans forme ma for alia de morka punktema i en registre- 
rad bild erh&lls ett stort antal sk&rningspunkter mellan 
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de ollka Hough- transf ormerna. Man kommer emellertid att 
fSt ett maximalt antal skarningspunkter for linjer som 
fdljer textraderna. 

Foretradesvis innefattar anordningen ett minne och 
5 ar anordnad att lagra de registrerade bilder, som skall 
omvandlas till teckenuppsattningar, i minnet, och att 
omvandla de lagrade bilderna till teckenuppsattningar 
efter att registreringen av bilderna avslutats. Genom att 
endast lagra de registrerade bilder som skall omvandlas 
10 till teckenuppsattningar minimeras minnesutrymmet som 
krlvg for att lagra registrerade bilder- Genom att 
omvandla de lagrade bilderna till teckenuppsattningar 
efter att registreringen av bilder avslutats behover man 
inte stall a hoga krav pa den optiska teckenigenkanningens 
15 hastighet vilket vore fallet om den ekulle utforas 
samtidigt som bilder registreras. 

Anordningen ar med fdrdel utformad sa att en an van - 
dare kan halla den i handen och pa avstind fran ett 
underlag registrera text pa underlaget eftersom det ar 
2 0 enklare att hantera en handhallen anordning. 

Med fordel ar anordningen anordnad att korrigera 
bilderna med avseende pa rotation innan de omvandlas till 
teckenuppsattningar. I fallet att man har identifierat 
textraderna i de registrerade bilderna kan korrigeringen 
25 med avseende pa rotation gdras relativt enkelt. Det ar en 
stor fordel att man har korrigerat bilderna med avseende 
:\: pa rotation sa att detta inte beh6ver gdras av tecken- 

igenkanningsalgoritmen . 

Pa motsvarande satt ar det £6rdelaktigt om anord- 
30 ningen ar anordnad att korrigera bilderna med avseende pa 
perspektiv innan de omvandlas till teckenuppsattningar 
eftersom den optiska teckenigenkanningen underlattas be- 
tydligt om alia bokstaver har samma storlek i de bilder 
pa vilka teckenigenkanningen skall utforas. 
35 De har korrigeringarna ar speciellt fdrdelaktig i 

fallet att anordningen ar utformad som en handhallen 
enhet som pa avstand fran under laget registrerar text pa 
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underlaget eftersoro en anvandare av en sadan handhallen 
enhet tried svarighet kan undvika att vrida och luta en- 
heten under regis treringen av bilderna. 

Givetvis ar det mojligt att anordningen ar utformad 
5 pa nagot annat satt an sow en helt och h&llet handhallen 
enhet- Exempelvis kan anordningen vara utformad som ett 
laghuvud som ar kopplat till en berakningsenhet i vilken 
de registrerade bilderna behandlas. Anordningen bestar 
enligt den har utf oringsf ortnen av tva fysiskt atskilda 
10 enhet er. 

Anordningen ar med fdrdel anordnad att puaela ihop 
teckenuppsattningarna genom att jamf&ra teckenuppsatt- 
ningarna parvis, varvid teckenuppsattningarna jamf6rs i 
ett antal inb&rdes lagen forskjutna i f&rhallande till 
15 varandra, Saledes jamfors ett forsta tecken i en fdrsta 
teckenuppsattning med tecken i den andra tecken- 
uppsattningen tills overensstammelse uppnas eller tills 
det forsta tecknet i den forsta teckenuppsattningen jam- 
forts med alia tecknen i den andra teckenuppsattningen, 
2 0 Darefter jamfSrs &verensstammelsen f5r de andra tecknen i 
den forsta teckenuppsattningen med tecknen i den andra 
teckenuppsattningen. Genom att g5ra jamforeleen f5r ett 
stort antal olika inb6rdes lagen kan ett flertal poang- 
sutnmor erhallas dar poangsumman aterspeglar over ens - 
25 stammelsen mellan de bada teckenuppsattningarna fdr det 
specif ika laget. Pa det bar sattet kan ett optimalt 
inb&rdes lage erhallas. 

Poretradesvis ar anordningen anordnad att lagra de 
registrerade bilderna som skall omvandlas till tecken- 
30 uppsattningar tillsammans med ett ordningsnummer som 
anger i vilken ordning bilderna registrerats och att 
pussla ihop teckenuppsattningarna med ledning av ord- 
ningsnumret fdr bilderna som motsvarar teckenuppsatt- 
ningarna. Speciellt i fallet att man f6rst registrerar 
35 alia bilderoch forst darefter pabdrjar teckenigen- 

kanningen och pusslingen ar det fordelaktigt att anvanda 
sig av ordningsnummer fdr de registrerade bilderna 
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eftersom man d& har ett stort antal bilder som skall 
pusslas ihop. Genom att pussla bilderna med ledning av 
ordningsnumret kan ett enklare datorprogram anvandas fdr 
pusslingen an vad som Slt f allet om man inte anv&nder sig 
5 av ordninganummer utan pusslar bilderna efter b&sta 

fiverensstcmtmelse. I det senare f allet m&ste en av bild- 
erna j amforaa med alia de andra bilderna f6r att se 
vilken som paasar bast och d&refter m&ste det h&r for- 
farandet &terupprepas for reeten av bilderna. 
10 Enligt en andra aspekt av f&religgande uppfinning 

tillhandahAlles ett fdrfarande for registrering av text 
p& ett underlag innefattande steget att avbilda och 
digitalt registrera bilder av texten, vilka bilder har 
delvis overlappande innehall . F6rf arandet utmarkes av att 
15 det aven innefattar stegen att omvandla Atminstone tv4 av 
de registrerade bilderna till vara en teckenupps&ttning, 
med ett flertal tecken, medelst optisk teckenigenJcanning, 
och att pussla ihop teckenupps&ttningarna med ledning av 
tecknen i teckenuppsattningarna . 
20 Det ar f&rdraget att det med sensorn registrerade 

omr&det &r si stort att ett flertal textrader avbildas i 
en registrerad bild. 

De olika sSrdrag som beskrivits i saxnband med anord- 
ningen ovan kan implement eras iven i for farandet enligt 
25 uppfinningen med samma fordelar som n&mnts ovan. 

Enligt en tredje aspekt av fdreliggande uppfinning 
tillhandahilles ett minnesmedium, vilket kan avlasas av 
en dator och p& vilket &r lagrat ett datorprogram som &r 
avsett att anvandas f6r omvandling av digitala bilder, 
30 som registrerats med en bildsensor, till text. Minnes- 
mediet utmarkes av att datorprogrammet innefattar 
instruktioner for att bringa datorn att mottaga digitala 
bilder som insignaler, att omvandla de digitala bilderna 
till teckenupps&ttningar, med ett flertal tecken, medelst 
35 teckenigenk&nning, och att pussla ihop teckenuppsatt- 
ningarna med ledning av tecknen i teckenuppsattningarna- 
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De olika s^rdrag eom beBkrivits i samband mcd anord- 
ningen ovan kan implementeras aven i minnesmediet enligt 
uppfinningen med samma f 6rdelar som namnts ovan. 

Gi vet via kan de olika sardragen som beskrivita ovan 
5 kombineras 1 samma utf oringsf orm. 

For att ytterligare belysa uppfinningen kommer i det 
foljande detaljerade utforingsforraer av uppfinningen att 
beskrivas, utan att emellertid uppfinningen skall anses 
vara begr&nsad hartill . 
10 Kort beakrivninq av ritninqarna 

Fig 1 visar schematiskt en anordning enligt en fdre- 
dragen utf oringsform av foreliggande uppf inning , 

Fig 2 visar schematiskt hur olika delar i anord- 
ningen ar kopplade till varandra. 
15 Fig 3 &sk&dligg6r hur bilder registreras av text pa 

ett papper enligt en foredragen utf dringsf orm av fore- 
liggande uppf inning. 

Fig 4 &skadliggor principen for Hough - 1 ransfortne- 

ring. 

20 Fig 5 visar maxpunkter f6r Hough-transf ormen av tvA 

olika bilder. 

Fig 6 viear hur man detekterar ordsslut och borjan 
pa ord enligt en foredragen utforingsf orm av foreliggande 
uppf inning . 

25 Fig 7 Ssk&dliggdr hur man kan anvanda de detekterade 

sluten och borjan p& ord for att grovt sortera bort de 
bilder som inte behover omvandlas till 
; teckenupps&ttningar . 

Fig 8 visar tv& teckenuppsattningar som skall 
30 pusslas ihop. 

Fig 9 ask&dliggor textrader i en registrerad bild. 
Fig 10 visar ett f lodesachema over funktionen hos 
-[ ett datorprogram enligt en foredragen utf oringsforrn av 

fdreliggande uppf inning. 
35 Beskrivnina av foredraana utf 6rinqs former 

I den i fig 1 visade utf oringsf ormen av anordningen 
enligt uppfinningen har denna ett h61je 1 med ungefar 
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samma form som en konventionell 6verstrykningspenna« 
H61jets ena kortande har en oppning 2, vilken ar avsedd 
att riktas mot ett omrade pa ett underlag i form av en 
informationsbarare som en anvandare 6nskar avbilda. 
5 Inf ormat ionsbararen kan exempelvis utg6ras av ett papper 
eller nagon annan typ av lagringsmedium, fran vilket man 
onskar registrera text i teckenf ormat . 

Holjet 1 inrymmer i huvudsak en optikdel 3, en 
elektronikdel 4 och en str&mf 6rsdr jningsdel 5. 

10 Optikdelen 3 innef attar dels ett linssystem 7, dels 

lysdioder 6, dels en ljuskanslig sensor 8 som utgSr 
granssnitt mot elektronikdelen 4. Lysdioderna 6 kan 
anvandas for att dka belysningen i fdrh&llande till den 
befintliga belysningen. 

15 Linssystemets 7 uppgift ar att avbilda ett omrade pa 

inf ormat ionsbarar en pa den Ijuskansliga sensorn 8 pa ett 
si korrekt satt som mojligt. Den Ijuskansliga sensorn 8 
utgors t ex av en tvadimensionell , CCD-enhet 
{CCD » Charge Coupled Device, laddningskopplad anordning) 

2 0 raed inbyggd A/D-omvandlare, S&dana eensorer ar kommersi- 

ellt tillgangliga, Sensorn 8 ar har monterad pa ett eget 
kretskort 11. Stromf 6rs6r jningen till anordningen erhalls 
f ran ett batteri 12 som ar monterat i ett separat fack 13 
i hdljet. Givetvis ar det mojligt att anvanda aven andra 
25 typer av sensorer, vilka omvandlar ljus till digitala 
signaler - 

I blockschemat i fig 2 visas elektronikdelen 4 sche- 
matiskt. Elektronikdelen 4 innef attar en processor 20, 
vilken via en buss 21 ar kopplad till ett lasminne 22 , i 

3 0 vilket processorns program ar lagrat, till ett akriv och 

lasminne 23, vilket utg6r processorns arbetsminne och i 
vilket bildema fran sensorn liksom tecken som tolkas 
fran de registrerade bilderna lagras, till en styr- 
logikenhet 24 och till sensorn 8. 
35 Styrlogikenheten 24 ar kopplad till ett antal peri- 

ferienhet, som innef attar en display 25, som ar monterad 
i holjet, en IR-sandtagare 26 f6r dverfdring av informa- 
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tion till/fr&n en extern dator, knappar 27 medelst vilka 
anvandaren kan styra anordningen, saint en drif tindike- 
ringsanordning 28 bestSende av t ex en andra upps&ttning 
lysdioder, som indiJcerar om registrering sker eller ej , I 
etyrlogikenheten 24 genereraa styrsignaler till mlnnena, 
sensorn och perif erienheterna . Styrlogiken hanterar &ven 
generering och prioritering av avbrott till processorn. 
Knapparna 2 7 , IR-s&ndtagaren 26, displayen 25 och lys- 
dioderna 6 nhs genom att processorn skriver och laser i 
registret i styrlogikenheten. Knapparna 27 genererar 
avbrott till processorn 20 nar de aktiveras. 

Anordningens funktion kommer nu att beskrivas med 
hanvisning till figurerna, I fig 3 visas ett papper 9 med 
ett flertal textrader 10. N&r en anv&ndare aktiverar 
anordningen medelst knapparna 27 och for den 5ver pappret 
med oppningen 2 riktad root pappret regis treras fyra 
bilder 14, 15 , 16, 17. Var och en av bilderna 14, 15, 16, 
17 omvandlas till teckenupps&ttningar sasom de som visas 
i fig 8. Darefter pusslas teckenuppsattningarna ihop sa 
att en hel text erhilles. Sasom visas i fig 3 ar en 
fdrsta bild 14 vriden i f6rh&llande till en andra bild 15 
vilken i sin tur &r vriden i forh&llande till en tredje 
bild 16, For att optimera den optiska teckenigenk&nningen 
i de registrerade bilderna 14, 15, 16, 17 ar det 
fordelaktigt att man k&nner till textradernas orientering 
i bilden. D<krf6r detekterae textradernas orientering 
innan teckenigenk&nningen utf6rs* Detekteringen av 
textradernas orientering gors med f6rdel med hj&lp av 
Hough-transf ormering „ 

Med hanvisning till fig 4 och 5 kommer nu Hough- 
transf ormering att beskrivas oversiktligt . I fig 4A visas 
tv4 punkter i planet med koordinaterna X och Y. I fig 4B 
visas Hough -transformen av punktema i fig 4A. En forsta 
punkt 18 har en forsta Hough-transf orm 19 vilken 
beskriver alia de rSta linjer som g&r igenorn den forsta 
punkten 18 i fig 4A som funktion av paramatrarna 9 och p 
d&r 9 &r vinkeln for den rata linjen genom den fdrsta 



ii/13 17:25 FAX +46 40 260516 AWAPATIifT AB * PV 

+46 40 260516 

Inlet Patent- ochreg.veriffit 
2000 -1M3 

13 Huvudfaxen Kassan 

punkten 18 och p ar den rata linjeng avetand fran origo i 
XY-planet. Pa motsvarande eatt har den andra punkten 29 
en andra Hough-transform 30. Den fdrsta och den andra 
Hough- trans formen i fig 4B skar varandra i punkten 31 och 
5 den rata linje som motsvarar av punkten 31 i fig 4B 

motsvarar den rata linje som gar genom bade den f6rsta 
punkten 18 och den andra punkten 29 i fig 4A. 

I fig 9 visas den andra registrerade bilden 15 fran 
fig 3. Den registrerade bilden 15 bestar av ett flertal 

10 bildpunkter i vilka textrader ekall hittas. Fdr varje 
svart punkt i den andra registrerade bilden 15 g6rs en 
Hough- transform. Hough- tr an sformerna laggs in i samma 
diagram, I fig 9 visas en f6rsta linje 32 och en andra 
linje 33. Linjer som har ungefar samma riktning som den 

15 forsta linjen 32 kommer att skara ett storre antal 

punkter an linjer som har ungefar samma lutning som den 
andra linjen 33 eftersom de morka bildpunkterna i den 
registrerade bilden 15 ligger langs textrader som har 
ungefar samma riktning som den forsta linjen 32. 

2 0 I fig 5 askadliggors hur maxima fdr antalet skar- 

ningspunkter kan anvandas for att bestamma textradernas 
orientering. Cirklarna 73 motsvarar de punkter i Hough- 
transf ormdiagrammet dar flest linjer skar varandra. 
Cirklarna 73 ligger pa en rat korsnings linje 34 och mot- 
25 svarar alia samma registrerade bild. De olika cirklarna 
73 motsvarar de olika raderna i den registrerade bilden- 
Fran avstandet mellan cirklarna 73 kan avst&ndet mellan 
textraderna bestammas. Korsningslinjens 34 lage langs 9- 
axeln indikerar hur den registrerade bilden Sr roterad. 

3 0 Den andra korsnings linjen 35 i fig 5 gar igenom ett 
flertal andra maxima som indikeras med kryss 36 i 
diagrammet . Den andra korsnings 1 in j ens 35 lutning 
indikerar att bilden har perspektiv dvs textraderna ser 
ut att ga ihop i den registrerade bilden. Den andra 

35 korsningslinjens 35 fftrskjutning i f&rhallande till den 
forsta linjen langs 9-axeln indikerar att textraderna ar 
roterade i den registrerade bilden. 
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Efter att textraderna liar identif ierats g6rs en 
identif iering av ordens borjan och slut i den registre- 
rade bilden. I fig 6 indikeras hur bokstaven "e" 3 7 
detekteras. Sisom visas i fig 6 raknas antalet mSrka 
5 bildpunkter 7 bildpunkter i ho j died vinkeltrat mot linjen 
38. Antalet m&rka pixlar ar 0 fram till borjan 39 pSi 
bokstaven "e" och blir Aterigen 0 vid slutet 40 av bok- 
staven ff e" . D& antalet m6rka pixlar varit 0 under en 
f orutbestamd period detekteras detta som ett ordslut. 

10 Med hanvisning till fig 7 visas hur orden indikeras 

som rektanglar varvid rektanglarnas bdrjan 41 indikerar 
borjan pi ett ord och rektanglarnas slut 42 indikerar 
slutet pa ett ord. Pig 7A motsvarar en forsta registrerad 
bild och fig 7B motsvarar en andra registrerad bild. Ett 

15 f&rsta ord 43 i fig 7A har sin motsvarighet i ett andra 
ord 44 i fig 7B. Pa motsvarande satt har ett tredje ord 
45 i fig 7A sin motsvarighet i ett f j&rde ord 46 i 
fig 7B. Genom att matcha de bada bilderna kan man ta reda 
-pk hur de registrerad® bilderna overlappar varandra, 

20 Genom att anvanda ordens l&ngd f6r varje rad ar det 

mojligt att genomfora eh grovpussling av de tva bilderna. 
Bilderna grovpusslas s& att en ffiljd av ordl&ngder i den 
forsta registrerade bilden over ens stammer med en f61jd av 
ordl&ngder i den andra regiBtrerade bilden. Ordl&ngdema 

25 langs olika rader i olika rader i den forsta registrerade 
bilden skall siledeg dverensstamma med ordl&ngder l&ngs 
motsvarande rader i den andra registrerade bilden. P& 
detta s^tt kan man bestamma hur bilderna S.r forskjutna 
relativt varandra. 

3 0 I fig 3 visas hur detta kan utnyttjas f6r att sorte- 

ra bort onodiga bilder sa att optisk teckenigenkanning 
inte behover utf&ras p& alia bilder som registrar as . En 
f6rsta bild 47 och en andra bild 49 Sverlappar helt det 
omrcide som tacks av en tredje registrerad bild 48 som 

3 5 indikeras med streckade linjer. Genom att anvanda fdr- 

farandet som beskrevs i samband med fig 7 kan den tredje 



• 00 11/13 17:26 FAX +46 40 260516 AWAPATHJT AB PV ®017 

+46 40 260516 lnt t patent- och reg.verket 

2000 -11- 1 3 

Huvudfaxen Kassan 

15 

regietrerade bilden 48 belt lamnas darhan utan att man 
genomfdr opt isk teckenigenkanning p& den. 

I fig 8 visas en fdrsta teckenupps&ttning 50 med ett 
flertal tecken 60 som motsvarar den forsta registrerade 
5 bilden 47 i fig 3 och en andra teekenuppsattning 51 med 
ett flertal tecken 61 som motsvarar den andra regist- 
rerade bilden 49 i fig 3, Texten i den fdrsta tecken- 
uppsattningen och den andra teckenuppsattningen f6ljer 
textradernas riktning 62 . Den forsta teckenuppsattningen 

10 50 och den andra teckenuppsattningen 51 pueslas ihop 
genom att man jamfor tecken i de bada teckenuppsatt- 
ningarna. S&lunda bdrjar man med att jamfdra det f6rsta 
tecknet 52 i den fdrsta teckenuppsattningen med vart och 
ett av tecknen i den andra teckenuppsattningen 51. Dar- 

15 efter gdr man pa motsvarande satt for det andra tecknet 
63 och det tredje tecknet 64 i den fdrsta 
teckenuppsattningen 50. God dverensstammelse erhalls nar 
tecknen i ordet "skilled" 53 jamfdres med ordet "skilled" 
54 p& den forsta raden i den andra teckenuppsattningen 

20 51- Eftersom ett ord kan fdrekomma pa manga stallen i en 
text sa utgar man fran den forst hittade 
overensstammelsen och jamfor darefter resten av texten 
fdr det har laget varvid en total po&ngsumma erhalls som 
indikerar hur val de bada teckenuppsattningarna 

25 dverensstammer f6r det har laget. Darefter aterupprepas 
det har steget for nasta lage dar dverensstammelse 
: . " - : erhalls. Slutligen valjs det lage vars poangsumma 

: indikerar bast dverensstammelse. X fig 8 Ir texten pa 

engeleka men en fackman inom omradet inser att texten 

3 0 lika garaa kunde vara pa nagot annat sprak och att texten 
i fig 8 endast anvands for att iskadliggdra funktionen 
hos anordningen. 

'Ill Genom att bilder pusslas forst med grovpussling och 

sedan med pussling pa teckenniva blir det mdjligt att 
35 genomfdra pussling i tva dimensioner utan att alltfdr 
stor datorkapacitet erfordras. Om lasanordningen fdrst 
fdrs at hdger som i fig 3 och sedan nedat och darefter at 
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v&nster erhAlls en et6rre yta som skall pusalaa i tva 
dimensioner. Genom att bestamma delbildernas inbdrdos 
relation med grovpussling och sedan pa teckenniva ar det 
relativt enkelt att astadkomma bade horisontell och 
5 vertikal puss ling. Genom egenskapen att raderna bestammer 
den vertikala positionen med stor noggrannhet erhalls 
inriktningsmo j lighet . Givetvis ar det inte alltid 
n6dvandigt att forst genom£6ra grovpussling. 

I foreliggande uppf inning firms kravet att 
10 informationen bef inner sig utmed identif ierbara rader. Om 
anordningen fdrs over ett fotograf i eller annan yta som 
inte ar uppdelad i rader, kan detta enkelt registreras av 
processorn i anordningen och derma del av bilden 6ver- 
hoppas . 

15 I fig 10 visas ett f 16desechema over funktionen hos 

ett datorprogram enligt uppf inningen. Datorprogrammet Sr 
anordnat att exekveras i elektronikdelen 4 i anordningen. 
I ett forsta steg 55 tnottages digitala bilder fran 
sensorxi 8 . I ett andra steg 56 ontvandlas de digitala 

20 bilderna till teckenstrangar medelst teckenigenk&nning . 1 
ett tredje steg 57 pusslas teckenstrangama ihop. 

En fackman inom omr&det inser att uppf inningen ej ir 
begransad till de hari visade ut£6ringsf ormerna utan att 
manga modif ieringar ar mojliga inom ramen f6r uppf in- 

25 ningen. Givetvis behover man inte utfora den i samband 
med fig 7 beskrivna grova passningen av de registrerade 
bilderna utan optisk teckenigenkanning kan utforas direkt 
p& de registrerade bilderna. Pa satnma satt behdver inte 
textradernas orientering identifieras i de registrerade 

30 bilderna om en optisk teckenigenkanningsalgoritm anvands 
som kan identifiera tecken aven d& textraderna ar 
roterade. 
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PATENTKRAV 

1. Anordning fdr registrering av en text genom 
avbildning av texten pa en ljuskanslig sensor (8) med en 

5 tvadimensionell sensoryta, vilken sensor (8> ar avsedd 
f6r digital registrering av bilder (14-17), k&nne - 
tecknad av att den ar anordnad 

att med sensorn registrera atminstone tva bilder 
(14-17) av texten, vilka bilder har delvis dverlappande 
10 innehall, 

att omvandla var och en av atminstone tva av de med 
sensorn registrerade bilderna till en teckenuppsattning 
(50, 51), innefattande ett flertal tecken (60, 61), 
medelst teckenigenkanning, och 
15 att darefter pussla ihop teckenuppsattningarna (50, 

51) med ledning av tecknen i teckenuppsattningarna. 

2. Anordning enligt patentkrav 1, vilken ar anordnad 
att identifiera textradernae riktning (62) i de 

registrerade bilderna (14-17, 47-49) , 
2 0 att identifiera start och slut f6r ord langs 

textraderna, 

att valja vilka av de registrerade bilderna (14-17, 
47-49) som skall omvandlas till teckenupps^ttningar (50, 
51) med ledning av ordens (53, 54) identif ierade start 
: 25 och slut i de registrerade bilderna, sa att endast bilder 

\ " med nodvandig information omvandlas till teckenupp- 

sattningar . 

- 3, Anordning enligt patentkrav 2, vilken ar anordnad 

att hitta textraderna (62) i de registrerade bilderna med 

#: ** : 30 hjalp av Hough-transf ormering av de registrerade bilderna 

(14-17, 47-49) . 

": 4. Anordning enligt nagot av fdregaende patentkrav, 

vilken innefattar ett minne och vilken ar anordnad 

att lagra de registrerade bilder (14-17, 47-49) som 
35 skall omvandlas till teckenuppsattningar (50, 51) i 
rninnet , och 
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att omvandla de lagrade bildema till 
teckenuppsattningar {50, 51) efter att registreringen av 
bilder avslutats. 

5, Anordning enligt nagot av foreg&ende patentkrav, 
5 vilken ar anordnad att korrigera de registrerade bilderna 
(14-17, 47-49) med aveeende pa rotation innan de 
omvandlas till teckenuppsattningar. 

6- Anordning enligt nagot av f&regaende patentkrav, 
vilken ar anordnad att korrigera de registrerade bilderna 
10 (14-17, 47-49) med avseende pa perspektiv innan de 
omvandlas till teckenuppsattningar. 

7 . Anordning enligt nagot av f dregiende patentkrav, 
vilken ar anordnad att pussla ihop teckenuppsattningarna 
(50, 51) genom att jamfSra teckenuppsattningarna (50 , 51) 

15 parvis, varvid teckenuppsattningarna (50, 51) jamfdrs i 
ett flertal inbordes lagen forskjutna (53 ,.54) i f6r- 
hallande till varandra. 

8. Anordning enligt nagot av foregaende patentkrav, 
vilken ar anordnad att lagra de registrerade bilder som 

20 skall omvandlas till teckenuppsattningar (50, 51) 

tillsantmans med ett ordningsnuntrner som anger i vilken 
ordning de registrerade bilderna (14-17, 47-49) 
registrerats och vilken ar anordnad att pussla ihop 
teckenuppsattningarna med ledning av ordningsnumret f6r 
; 25 de registrerade bildema (14-17, 47-49) som motsvarar 

* teckenuppsattningarna (50, 51) , 

\ 9* Forfarande f6r registrering av text innefattande 

steget att avbilda och digitalt registrera bilder (14-17, 
47-49) av texten, vilka bilder har delvis overlappande 
30 innehall, kannetecknat av att det aven 
innefattar stegen 
: # att omvandla atminstone tva av de registrerade 

bilderna (14-17, 47-49) till vars en teckenuppsattning 
(50, 51) , med ett flertal tecken, medelst tecken- 
3 5 igenkanning, och 
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att d&refter pussla ihop teckemippsattningarna (50 , 
51) med ledning av teckxxen i teckenupps&ttningama (50, 
51) . 

10. P6rfarande enligt patentkrav 9, vilkot Sven 
5 innefattar stegen 

att identif iera textrademas riktning (62) i de 
registrerade bilderna (14-17, 47-49), 

att hitta start och slut for ord (53, 54) l&ngs 
textraderna , 

10 att v&lja vilka av de registrerade bilderna som 

skall omvandlag till teckenuppsattningar (50, 51) med 
ledning av ordens (53 , 54) identif ierade start och slut i 
de registrerade bilderna (14-17/ 47-49) , sk att endast 
bilder med nSdv&ndig information omvandlas. 

15 11. Forfarande enligt patentkrav 10, varvid 

textraderna identif ieras med hjalp av Hough - 
transformering av de registrerade bilderna (14-17, 47- 
49) . 

12. FSrfarande enligt nfigot av patentkraven 9-11, 

20 varvid de registrerade bilderna (14-17, 47-49) korrigeras 
med avseende pk rotation innan de omvandlas till 
teckenuppsattningar (50, 51) . 

13. Forfarande enligt n&got av patentkraven 9-11, 
varvid de registrerade bilderna korrigeras med avseende 

i 25 pk perspektiv innan de omvandlas till teckenuppsattningar 

V = (50, 51) . 

14 . Miimesmedium, vilket kan avlasas av en dator och 
pk vilket kr lagrat ett datorprogram som ar avsett att 
anvindas for omvandling av digitala bilder (14-17, 47- 

* r : 3 0 49) , till text, kannetecknat av att dator- 

programmet innefattar instruktioner f6r att bringa datorn 

att mottaga digitala bilder (14-17, 47-49) som 
insignaler, 

att omvandla de digitala bilderna (14-17, 47-49) 
35 till teckenuppsattningar (50, 51), med ett flertal tecken 
(60, 61), medelst teckenigenk&nning, och 
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att pussla ihop teckenuppsattningama (50, 51) med 
ledning av tecknen {60, 61) i teckenuppsattningama (50, 
51) . 
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En anordning och ett f6rf arande for registrering av 
text genom avbildning av texten pa en ljuskanslig sensor 
5 (8) med en tv4dimensionell sensoryta beskrivs, 

Anordningen ar anordnad att utfdra f&rfarandet att 
oravandla atminstone tva av de med sensorn registrerade 
bilderoa (14-17, 47-49) till vars en teckenuppsattning 
(50, 51), innefattande ett flertal tecken {60, 61), 
10 medelst teckenigenkanning, och att darefter pussla lhop 
teckenuppsattningarna (50, 51) med ledning av tecknen i 
teckenuppsattningarna . 
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